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与 途径 ， 得 出 线粒体 通过 内 共生 起 源 ， 也 是 从 原始 的 线粒体 基因 组 向 小 基因 组 和 大 基因 组 两 种 
方向 发 展 ， 并 有 着 两 种 与 核 ( 类 核 ) 基 因 组 的 可 比较 的 进化 途径 的 结论 。 这 两 种 进化 途径 能 很 好 
地 说 明 不 同类 型 的 真 核 生 物 { 特 别 是 分 别 以 动物 和 植物 为 代表 ) 的 线粒体 基因 组 的 结构 差异 和 特 
点 。 本 文 还 提出 了 一 个 关于 重复 序列 、 断 裂 基 因 ( 内 含 子 )、 核 (类 核 ) 基 因 组 、 细 胞 器 基因 组 的 
起 源 和 进化 的 一 般 模 式 。 


关键 词 “线粒体 ， 基因 组 结构 ， 动物 ， 植 物 ， 进 化 途径 


线粒体 是 真 核 生 物 的 一 个 重要 细胞 器 官 ， 它 的 起 源 是 与 真 核 细胞 的 起 源 密切 联系 在 一 
起 的 。 目 前 已 有 大 量 的 、 越 来 越 多 的 事实 支持 线粒体 的 内 共生 起 源 学 说 (Margulis， 
1981; 李靖 炎 ，1989)， 从 而 线粒体 的 起 源 和 进化 就 是 一 个 从 自主 性 的 古代 原核 生物 向 半 
自主 性 的 细胞 上 器官 的 发 展 、 进 化 过 程 。 

作为 一 个 能 自我 更 新 的 细胞 器 官 ， 线 粒 体 含有 独特 的 基因 组 。 在 其 组 成 上 ， 一 般 有 编 
码 线粒体 内 大 小 亚 基 rRNA 的 基因 、 全 部 或 部 分 线粒体 tRNA 基因 、 部 分 呼吸 链 特 有 酶 
的 基因 。 线 粒 体 的 基本 功能 几乎 在 所 有 的 真 核 生物 细胞 中 都 是 相同 的 。 而 另 一 方面 ， 线 粒 
体 基 因 组 的 大 小 、 结 构 在 不 同 的 真 核 生物 中 有 着 很 大 的 差别 ， 从 最 小 的 14.3 kb(Ascaris 
suum Wik Wolstenholme 等 ，1987) 到 最 大 的 2400 kb(Cucumis melo Ht )(Ward F, 
1981): 在 结构 组 成 ， 特 别 是 在 非 编 码 DNA 的 组 成 上 同样 有 着 很 大 的 种 类 间 差 异 。 因 
此 ， 虽 然 对 于 线粒体 的 起 源 已 有 了 公认 ， 但 是 对 其 进化 方式 、 途 径 及 其 基因 组 结构 上 差异 
的 原因 等 问题 却 远 没有 得 到 满意 的 答案 。 

在 这 种 情况 下 ， 本 文 分 析 了 不 同类 型 的 真 核 点 物 线粒体 基因 组 的 结构 特点 ， 综 合 这 些 
特点 并 根据 作者 提出 的 核 ( 类 核 ) 基 因 组 的 进化 模式 与 途径 (Zhang Shanghong, 1990; 张 
尚 宕 ，1993b})， 试 图 把 核 外 线粒体 基因 组 的 进化 与 核 (类 核 ) 基 因 组 的 进化 统一 起 来 。 
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多 细胞 动物 的 线粒体 基因 组 有 着 相当 一 致 的 结构 特点 ， 十 分 细小 和 致密 ， 大 小 一 般 在 
16 kb 左右， 基因 的 排列 紧密 ， 没 有 或 很 少 基因 间隔 序列 ， 所 有 基因 都 不 含 内 含 子 。 除 了 


1983; Sederoff, 1984; Gray. 1989). 


表 1 后 生动 物 线粒体 基因 组 的 大 小 及 形状 


Tab. 1 Sizes and conformation of metazoan mitochondrial genomes 


物种 

A HE 

Homa sapiens (human) 

Pan troglodytes ichimpanzee? 
Cercopithecus uetinops (green monkey) 
Mus musculus (mouse) 

Rattus rattus (rat) 

Bas taurus (bovine? 

Orvotalagus cunwulus (rabbit) 

Gallus domestwus (chicken) 
Cnemidophorus (lizard,]1 species) 
Xenopus ifrog,2 species] 

oR ah ty 

Strongylocentratus (sea urchin.3 spp. ) 
软体 动物 

Placto pecten mageliant us lscallopl 

Fe oh 

Drosephia neahyder (fruitfly? 

D melanogaster 

线虫 


Ascaris suum (roundworm) 


T SES RAS 与 种 群 有 关 : 


太 小 [Kby 


16.569 
16.4 
16.4 
16.295 
16.4 
16.338 
17.3“ 
16 2 
17.5 
177 


15.7 


32 上 一 39.3 


15.7 


18 7—19 5% 


14.3 


形状 


环 决 
环形 
Fi 
aR AR 
PRAR 
环 状 
环 状 
环 状 
环 状 
FRAR 


HAR 


环 状 
环 状 


环 状 


整个 基因 组 都 是 编码 的 。 在 基因 排列 顺序 上 也 较 少 变化 
1989)。 有 关 动 物 线粒体 基因 组 的 大 小 、 形 状 等 情况 见 表 1 资料 来 源 见 Brown. 


从 表 1 中 看 出 ， 绝 大 部 分 动物 线粒体 基因 组 的 大 小 都 在 15.7- 一 19.5 kb 的 范围 内 ， 是 
最 小 的 动物 核 基因 组 的 1 / 25000(Brown. 1983), E. coli 基因 组 的 的 1 7 250。 由 于 其 细 
小 及 致密 性 ， 以 至 被 认为 是 “遗传 节俭 的 极端 例子 "(Attardi，1985)。 另 一 方面 ,线粒体 基 
因 组 的 大 小 与 动物 类 群 并 不 具 一 定 的 关系 ， 在 Drosophila 中 ， 基 因 组 的 大 小 几乎 包括 了 
所 有 动物 的 变化 范围 。 近 年 来 发 现 的 一 些 动物 线粒体 基因 组 的 例子 ， 在 一 定 程度 上 影响 了 
后 生动 物 线粒体 基因 组 大 小 的 均一 性 。 如 猪 丹 虫 (4、，Suun) 只 有 14.3 kb 的 基因 组 ， 而 海 
ICP. magellanicus) WA Fit 30 kb 的 基因 组 (Snyder 等 ，1987)， 是 一 般 动 物 的 两 倍 ， 而 
且 还 有 较 太 的 个 体 间 善 异 ( 商 达 了 kb) Ascaris 中 的 小 基因 组 是 由 于 缺失 了 apl ATP 合 
RAPER A, th Placropecten 中 的 特异 基因 组 的 个 体 间 差异 是 由 于 某 些 片断 的 重复 数 
目 不 等 所 致 ， 其 大 小 则 可 能 是 由 于 整个 原来 的 基因 组 倍增 所 致 (未 能 证 实 ，Snyder 等 ， 
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1987)， 因 此 也 有 可 能 是 由 于 含有 较 多 的 非 编 码 序列 }。 即 使 有 这 样 的 一 些 特例 ， 但 与 其 他 
种 类 比较 ， 后 生动 物 线粒体 基因 组 的 大 小 和 结构 总 的 来 说 都 是 十 分 保守 的 。 


2 高 等 植物 线粒体 基因 组 的 结构 


与 后 生动 物 相 反 ， 高 等 植物 (已 有 的 研究 主要 限于 被 子 植物 ) 线 粒 体 基因 组 在 结构 和 组 
成 上 是 真 核 生 物 中 最 复杂 、 最 不 均一 的 ， 并 以 其 特大 作为 显著 特征 。 已 知 最 小 的 被 子 植物 
线粒体 基因 组 也 有 208 kbtBrassica hirta 白 草 ) Palmer 等 ，1987)， 比 动物 的 线粒体 基因 
组 大 10 倍 以 上 。 而 在 被 子 植物 中 ， 也 有 高 达 10 倍 的 大 小 差异 ， 最 大 的 可 达 2400 kb 
(C. melo 甜瓜 )。 即 使 在 同一 个 科 !Cuecurbitaceae 戎 芦 科 ) 中 ， 差 异 范围 也 可 达 7 倍 之 多 
(Ward $. 1981), & i fi Hb RU Marchantia polymorpha) 的 线粒体 基因 组 也 有 186.6 
kb(Oda 4, 1992) WL# 2). 

表 2 高 等 植物 线粒体 林 因 组 的 大 小 及 形状 2 
Tab. 2 Sizes and conformations of higher plant mitochondrial genomes 


物种 大 小 (kb) 形状 
BH 

Marchantia polymer pha (liverwort) 186.608 环 状 
被 子 植物 

Brasswa hirta (white mustard) 208 环 状 
B. campestris (turnip) 218 三 环 
Pisum sativum (pea) 370 一 
Citrullus vulgaris (watermelon) 340 一 
Cucurbita pepo (zucchini) 870 = 
Cucumis sativus (cucumber) 1500 = 
C mela (muskmelon) 2400 = 
Zea mays (maize.fertile) 570 BR 
Z. mays (maize.cms—S) 570 SBR 


T BES Sederoff, 1934, Palmer, 1985; Gray, 1989, Oda 3%, 1992, 


在 结构 组 成 上 ， 变 化 也 是 很 大 。 基 因 在 线粒体 基因 组 中 都 是 以 散布 的 形式 存在 。 在 基 
因 排 列 顺序 上 ， 除 了 物种 特异 性 仍然 存在 外 ， 不 同 物种 中 { 即 使 是 亲缘 关系 较 近 的 ) 的 排列 
需 序 有 很 大 差别 ， 黄 至 很 少 看 到 共同 的 情况 (rRNA 基因 的 排列 舌 序 还 是 较 保 守 的 ) 
{Gray，1989)。 这 说 明基 因 组 内 的 重组 现象 在 进化 过 程 中 是 频繁 发 生 的 。 虽 然 一 些 在 其 他 
类 型 真 核 生 物 线粒体 基因 组 中 不 存在 的 基因 可 以 在 植物 中 找到 ， 但 这 远 远 不 能 说 明 其 线 粒 
体 基 因 组 如 此 之 大 。 因 此 ， 植 物 线粒体 基因 组 似 平 含 在 大 量 的 非 编 码 序 列 {(Gray，1989)， 
这 些 非 编码 序列 包括 基因 间隔 、 非 编码 的 重复 序列 和 内 含 子 。 

在 重复 序列 方面 ， 一 些 长 度 达 数 kb 并 在 部 分 区 域 编码 的 正 向 重复 序列 对 线粒体 基因 
组 的 重组 起 着 很 重要 的 作用 。 正 是 这 些 正 向 重复 序列 使 得 基因 组 能 以 一 个 主 环 与 数 个 通过 
基因 组 内 重组 而 形成 的 亚 环 组 成 的 多 环 结 构 形 式 、 蕉 至 多 线 状 的 形式 存在 { 表 2}。 另 外 ， 
从 已 有 的 序列 资料 看 来 ， 高 等 植物 线粒体 DNA 是 含有 大 量 较 短 的 、 散 布 的 重复 序列 
{Gray，1989)。 在 已 测序 的 地 钱 线 粒 体 基因 组 中 ， 就 有 相当 数量 的 、 小 于 800 bp 的 非 编 
码 重复 序列 (OQda 等 ，1992)。 
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还 有 一 个 与 后 生动 物 线粒体 基因 组 结构 不 同 的 特点 是 一 些 基 因 具 有 内 含 子 。 如 玉米 中 
完全 测序 的 细胞 色素 亚 基 开 基因 就 含有 一 个 位 于 基因 中 部 的 794 bp 的 内 含 子 (Fox 等 ， 
1981)。 而 完全 测序 的 地 钱 基 因 组 则 共有 32 个 内 含 子 (Dda 等 ，1992)。 因 此 ， 后 生动 物 与 
高 等 植物 的 线粒体 基因 组 结构 是 真 核 生 物 中 的 两 个 极端 的 代表 。 


3 原生 动物 、 获 类 和 真菌 线粒体 基因 组 的 结构 


这 几 类 较为 低 等 的 真 核 生物 的 线粒体 基因 组 一 方面 可 以 培 是 或 偏向 于 动物 类 型 ， 或 偏 
向 于 植物 类 型 {如 大 小 ， 见 表 3)， 男 一 方面 又 有 其 十 分 独特 之 处 。 原 生动 物 中 研究 得 较 
多 ， 最 特别 的 是 Kinetoplastida( 动 体 目 ) 的 动 基体 ( 即 这 类 生物 唯一 的 线粒体 JDNA。 
动 基体 DNA 是 由 5x 10: 一 5x 104 个 小 环 与 20 一 100 个 大 环 组 成 的 网 状 结构 (Benne 等 ， 
1983; Simpson，1987)。 小 环 只 有 1 一 3 kb， 大 环 为 20—40 kb， 只 有 大 环 才 具 线粒体 的 


表 3， 厌 生动 物 、 菠 类 和 真菌 线粒体 基因 组 的 大 小 及 形 状 “ 


Tab. 3 Sizes and conformations of mitochondrial genomes in protozoa,algae and fungi 





物种 太 小 (kb) FER 
原生 动物 
Acanthamoeba castettanii 40 SHAR 
Plasmodium laphurae 18.5 SPAR 
Parameciuum aurelia 40 BR 
Tetrahymena pyriformis 55 HR 
Crithidia luciliae 35 AH 
Trypanosoma brucei 20—22 AR 
T. cruzt 40 AR 
Leishmania tarentolae 30.5 AH 
藻类 
Chlamydomonas remhardtii 15.8 KAR 
Chlorella pyrenardosa 30 一 
Euglena gracilis 60 = 
Cyanophora paradoxa 200 = 
Otisthodiscus luteus 40 BRR 
真菌 
Aspergillus nidulans 32—33 SPAR 
Brettanomyces custersis 108 HAR 
Cochliobolus heterostra phus 115 环 状 
Hansenula mrakii 55 BR 
H. wingei 25.5 环 状 
Neurospora crassa 62 HR 
Podospora anserina 95 环 状 
Saccharomyces cerevisiae KL14-4A 77.8 HAR 
S cerevisiae NCYC 74 68 RAR 
S. exiguus 23.7 PR 
Schizosaccharomyces pombe EF | 17.6 RAR 
S. pombe 50 19.43 SPAR 
S. pombe EF 2 23 RAR 
Torulapsis glabrata CBS 138 18.9 Fik 


DRRR Sederoff, 1984; Palmer, 1985, Wolf, 1988: Gray, 1989, 
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特有 基因 并 在 同一 物种 内 具有 相同 的 结构 。 因 此 一 般 把 大 环 看 作 是 这 类 原生 动物 的 线粒体 
基因 组 。 这 样 的 一 种 基因 组 中 只 有 一 段 15—17 kb 的 较为 保守 的 转录 区 ， 已 确定 的 所 有 
基因 都 位 于 这 一 区 域内 {Gray，1989)。 有 关 的 研究 并 没有 发 现 内 含 子 的 存在 (Benne 等 ， 
1983; Simpson，1987)， 不 过 基因 的 排列 并 不 象 后 生动 物 线粒体 中 的 那样 紧密 。 余 下 的 
一 段 是 基本 上 不 转录 而 且 变 化 较 大 的 区 域 ， 这 一 区 域 主要 由 一 些 长 短 不 一 {如 3 一 239 bp) 
的 重复 序列 组 成 (Muhich 等 ，1985)。 ; 

另 一 类 原生 动物 纤毛 虫 的 线粒体 基因 组 为 线 状 ， 大 小 在 40—55 kb 之 间 { 表 3) 
Tetrajiymena( 四 膜 虫 属 ) 的 基因 组 较 大 的 原因 之 一 是 大 亚 基 rRNA 基因 有 两 个 拷贝 ， 构 成 
一 较 大 的 反 向 重复 (Goldbach 等 ，1978)， 而 且 大 、 小 亚 基 rRNA 的 基因 本 身 又 是 断绝 的 
“再 由 两 个 部 分 组 成 )(Schnare 等 ，1986; Heinonen 等 ，1987)。 另外 ， 在 基因 组 的 两 端 具 
有 类 似 端 粒 的 串联 重复 序列 (30- 一 50 bp)fMeorin 等 ，1988)。 不 过 ， 基 因 组 中 含有 的 tRNA 
基因 较 少 ， 不 足以 提供 线粒体 内 合成 蛋白 质 所 需 的 全 部 URNA(Suyama. 1986). 5 —F 
和 面 ， 对 这 类 基因 组 其 他 区 域 的 研究 还 不 多 。 

在 藻类 中 ， 对 线粒体 基因 组 的 研究 较 少 。 比 较 突出 的 是 Chlamydomonas reinhardtii 
CRA ABH 15.8 kb 的 线 状 基因 组 { 表 3)， 它 是 已 知 的 单 细胞 真 核 生 物 (原生 生物 ) 中 最 小 
的 ， 在 结构 上 更 象 动物 的 而 不 象 植物 的 线粒体 基因 组 (Gray 等 ，1988)。 有 一 些 藻类 。 如 
Cvanophora paradox LEREN), HA ARAR ZARA 3). 

真菌 线粒体 基因 组 的 变化 也 较 大 ， 大 小 从 Schizosaccharomyces pombe EF HEIA BA 
酵母 ) 的 17.6 kb 到 Cochliobolus heterostrophus 5¢ We 1a EZ BA AD 115 kb(Wolf 4. 1988), 
而 且 在 关系 较 近 的 类 群 中 ， 甚 至 在 同一 属 中 ， 都 可 有 相当 大 的 变化 范围 ( 表 3)。 影 响 基 因 
组 大 小 的 历 素 有 以 下 一 些 ， 基 因 问 隔 的 长 度 、 基 因 编 码 部 分 的 长 度 多 态 性 、 内 含 子 的 存在 
与 否 、 重 复 序列 的 存在 及 其 数量 、 基 因 组 片断 的 倍增 、 一 些 新 的 可 读 框 fORE) 的 存在 等 。 
不 同 种 类 的 真菌 的 基因 排列 顺序 可 有 很 大 的 变化 .并 在 不 同 的 属 中 就 有 所 不 同 {(Weolf 等 ， 
1988)。 较 小 的 真菌 基因 组 (如 S. pombe FT. giabratu) 的 基因 排列 也 是 较 紧密 的 。 但 与 动 
物 不 同 的 是 ， 虽 然 苏 着 基因 组 变 小 ， 内 含 子 的 数量 减少 ， 但 即使 在 最 小 的 基因 组 中 ， 也 有 
个 别 基因 有 具 内 含 子 {Lang 等 ，1983; Wolf 等 ，1988)。 内 含 子 在 真菌 线粒体 基因 组 中 是 普 
万 存在 的 ， 但 其 含量 变化 很 大 ， 以 至 连 物 种 特异 性 都 没有 ， 即 一 个 株 系 中 某 个 基因 的 内 含 
子 在 隔 种 的 另 一 个 株 系 中 就 不 存在 了 (Sederoff，1984)。 内 含 子 的 这 一 变化 动态 在 真菌 中 
最 为 显著 。 重 复 序列 在 真菌 的 线粒体 基因 组 中 也 是 存在 的 。 在 基因 间隔 较 大 的 种 类 中 ， 可 
以 在 其 间 也 区 域 找 到 一 些 较 短 的 重复 序 齐 ， 并 在 整个 基因 组 中 都 有 分 布 (Clark 一 Walker 
等 ，1974)。 

原生 动物 、 药 类 和 真菌 这 三 类 真 核 生 物 的 线粒体 基因 组 结构 的 差异 是 很 大 的 ， 而 有 旦 在 
同一 类 中 也 十 分 不 均一。 不 过 总 的 说 来 ， 具 较 小 基因 组 的 还 是 园 接 近 后 生动 物 的 ， 而 有 共有 
较 大 基因 组 的 则 是 偏向 于 植物 的 。 


4 两 种 进化 途径 


以 上 的 分 析 显 示 出 线粒体 基因 组 的 结构 在 不 同类 型 的 真 核 生物 中 差异 甚大， 在 同类 型 
的 生物 中 也 有 相当 大 的 变化 。 从 线粒体 内 共生 起 源 及 基因 组 进化 的 观点 看 ， 现 代 线 闵 体 应 
该 有 其 原始 的 祖先 并 洛 着 一 定 的 途径 进化 。 而 进化 途径 一 般 会 在 现代 基因 组 中 留 下 一 些 
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遗迹 ， 找 到 这 些 遗 迹 对 研究 基因 组 的 
进化 及 重建 其 进化 途径 是 有 极 大 帮助 
的 。 而 且 ， 既 然 线 粒 体 的 起 源 和 进化 
是 一 个 队 自 主 性 的 古代 原核 生物 向 半 
自主 性 的 细胞 具 官 的 发 展 过 程 ， 那 
么 ， 线 粒 体 基因 组 的 进化 与 核 ( 类 核 ) 
基因 组 的 进化 是 否 有 一 定 的 相关 性 ， 
并 可 以 统一 在 总 的 进化 模式 中 呢 ? 
对 于 核 (类 核 ) 基 因 组 的 进化 本 
文 作者 提出 过 一 个 最 原始 的 * 基 因 ? 和 
“基因 组 ”是 由 重复 序列 组 成 (Zhang 
Shanghong, 1990:5K mi Æ, 1993a: 
1993b: 1994)， 并 在 这 样 的 一 个 基础 
上 发 展 成 具有 原始 的 外 显 子 ， 内 含 子 
及 重复 序 别 的 原始 基因 组 ， 再 向 着 小 
基因 组 与 大 基因 组 两 个 方向 发 展 的 进 
化 模式 (Zhang Shanghong,1990; 
gk fel 2, 1993b)(F 1)。 如 果 癌 小 基 
因 组 进化 ， 则 由 于 繁殖 效率 、 空 间 结 
HEER, THRABR FH. AS 
子 存在 的 余地 (它们 在 进化 过 程 中 丢 
kh 如 果 向 大 基因 组 进化 ， 则 重复 
序列 、 内 含 子 作为 残 遗 结构 ， 都 能 继 
续 存 在 ， 并 起 着 结构 上 与 进化 上 的 功 
能 。 在 现代 生物 中 ,原核 生物 的 类 核 
是 小 基因 组 进化 方向 的 代表 ， 而 真 核 
生物 的 核 则 是 大 基因 组 进化 方向 的 代 
表 。 支 持 这 一 进化 模式 的 事实 正 逐 产 
增多 ( 张 尚 宕 ，1993b)， 比 较 重 要 的 
是 我 们 的 确 可 以 在 一 些 原核 生物 ( 原 
细菌 ) 的 基因 组 中 找到 重复 序列 
(Doolittle 等 ，1983) 或 内 含 子 (多 jemas 
等 ，1985)。 这 样 的 一 个 进化 模式 比 
重复 序列 的 后 起 源 观 点 、 内 含 子 的 后 


最 原始 的 
“SARA BAAS aa i ” 
A 基因 "和 


化 学 连结 “基因 组 ” 
分 化 . 特 化 


| 


原始 的 基因 和 基因 组 
(ARRET. AET 
及 重复 序列 ) 


/~ 


原核 生物 基因 (组 ) ” 真 核 生物 基因 (组 ) 


AA 为 可 自我 复制 的 原始 生物 大 分 子 ， 
框 内 图 案 代 表 特异 的 系列 


图 1 重复 序列 、 基 因 结 构 和 核 { 类 核 ) 基 因 
组 的 起 源 和 进化 (根据 张 尚 宏 ，1993b) 
Fig. 1 The origin and evolution of repeated sequences, 


gene structure and nuclear {nucleoid} genomes 
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进化 。 


再 分 析 一 下 线粒体 基因 组 的 情况 ， 现 代 线 粒 体 在 真 核 细胞 中 只 具有 一 定 程 度 的 独立 
人 性， 很 多 线粒体 本 身 所 需 的 蛋白 质 都 古 由 核 基 因 组 编码 并 在 细胞 质 内 合成 后 再 运送 到 线 粒 
体内 的 。 因 此 ， 线 粒 体 本 身 的 基因 组 可 以 很 小 ， 正 如 后 生动 物 的 那样 。 不 过 相 比 之 下 ， 植 
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物 的 线粒体 基因 组 却 是 很 大 。 远 超出 它 编码 蛋白 质 等 所 需 的 大 小 。 从 而 线粒体 基因 组 实际 
上 也 有 向 小 基因 组 进化 与 向 大 基因 组 进化 的 两 种 途径 。 

根据 核 (类 核 ) 基 因 组 的 进化 及 线粒体 内 共生 起 源 的 模式 ， 线 粒 体 的 祖先 应 是 一 种 已 有 
相当 大 的 基因 组 的 古代 原核 生物 。 由 于 处 在 基因 组 进化 的 比较 原始 阶段 、 这 样 的 基因 组 与 
现代 真 细菌 的 基因 组 不 同 ， 是 应 该 含有 原始 的 重复 序列 和 内 含 子 的 。 

关于 线粒体 的 祖先 ， 已 有 多 方面 的 证 据 显 示 线 粒 体 与 现代 真 细菌 中 的 紫色 非 硫 光 合 细 
菌 的 a 枝 相 似 (李靖 炎 ，1989; Gray，1989)， 表 明 线 粒 体 是 源 于 这 类 真 细菌 的 原始 祖先 。 
据 化 石 资料 显示 ， 真 核 细胞 在 15 亿 年 或 更 早 以 前 就 已 形成 。 而 原核 与 真 核 基因 组 的 分 化 
就 更 早 了 ， 可 以 追溯 到 35 亿 年 前 (Gray 等 ，1982)。 因 此 ， 线 粒 体 的 祖先 也 起 码 在 15 亿 
年 前 就 进 人 了 内 共生 阶段 。 在 这 一 时 期 ， 原 细菌 、 真 细菌 与 真 核 生 物 这 三 系 在 基因 组 水 平 
上 早已 分 化 ， 但 毕竟 还 是 处 于 比较 原始 的 阶段 ， 在 真 细菌 这 一 系 的 基因 组 中 应 是 仍然 含有 
一 定数 量 的 重复 序列 和 内 含 子 。 这 点 虽然 未 被 证 实 ， 即 在 现代 真 细菌 基因 组 中 ， 还 设 有 发 
现 重复 序列 和 内 含 子 。 但 含有 少量 这 些 成 分 的 可 能 性 是 存在 的 。 即 使 对 于 E.coli 这 种 研 
究 得 如 此 之 多 的 真 细菌 ， 其 基因 组 中 存在 内 含 子 的 可 能 性 仍然 不 能 排除 (其 噬菌体 T4 的 基 
因 组 中 就 有 内 含 子 ，Cech，1986)。 从 而 ， 现 代 紫 色 非 硫 光 合 细 菌 枝 的 基因 组 中 是 否 残 
留 少 量 重复 序列 和 内 含 子 也 有 待 研究 。 另 一 方面 ， 即 使 它们 完全 不 含 这 些 成 分 ， 也 不 能 说 
明 作 为 线粒体 祖先 的 基因 组 也 是 这 样 。 可 以 比较 肯定 地 认为 ， 象 现代 动物 线粒体 基因 组 那 
样 细小 和 致密 的 不 可 能 与 线粒体 祖先 的 基因 组 相似 。 相 反 ， 与 现代 植物 线粒体 基因 组 并 没 
有 太 大 不 同 的 倒 有 可 能 象 线粒体 祖先 的 基因 组 (Gray，1989; Oda 等 、1992)。 

已 进 人 内 共生 状态 的 线粒体 祖先 的 基因 组 在 进化 过 程 中 ， 一 方面 把 相当 部 分 的 基因 转 
BAK 中 (同时 也 接受 一 些 来 自 核 、 其 他 细胞 器 官 的 DNA 片断 )， 另 一 方面 就 沿 着 小 基因 
组 方向 与 大 基因 组 方向 两 种 途径 发 展 。 癌 小 基因 组 进化 的 以 后 生动 物 为 代表 ， 也 包括 具 较 
小 基因 组 的 原生 动物 、 薄 类 和 真菌 ， 以 不 再 含有 或 只 有 很 少 重 复 序列 和 内 含 子 等 非 编码 成 
分 为 特点 。 而 向 大 基因 组 进化 的 以 高 等 植物 为 代表 ， 也 包括 一 些 具 较 大 基因 组 的 低 等 真 核 
生物 ， 以 含有 较 多 甚至 大 量 的 重复 序列 和 内 含 子 为 特点 。 

事实 上 ， 线 粒 体 基 因 组 的 结构 在 不 同 生 物 中 的 差异 和 特点 可 以 在 很 大 程度 上 用 这 两 种 
进化 途径 来 说 明 。 动 物 的 线粒体 基因 组 很 小 ， 不 存在 重复 序列 和 内 含 子 ， 而 植物 的 线粒体 
基因 组 很 大 ， 重 复 序列 和 内 含 子 均 存在 ， 并 占 基 因 组 相当 重要 的 比例 ， 基 因 组 的 结构 也 变 
化 较 大 。 原 生动 物 、 东 类 和 真菌 中 ， 较 小 基因 组 的 结构 模式 偏向 于 动物 型 ， 重 复 序列 或 内 
含 子 的 存在 可 以 看 作 是 一 种 “ 扯 迹 ”， 是 对 认为 线粒体 祖先 的 基因 组 中 含有 重复 序列 、 内 含 
子 的 支持 ; 较 大 基因 组 的 结构 模式 则 依 向 于 植物 型 ， 并 且 处 于 一 种 变化 动态 中 (如 真菌 中 
的 内 含 子 结构 )。 这 是 线粒体 基因 组 的 进化 其 总 体 上 所 遵循 的 两 种 途径 。 当 然 各 类 生物 还 
有 不 少 各 自 的 特点 (如 基因 组 的 重组 )， 而 且 在 一 些 进化 未 枝 中 ， 也 存在 一 些 基 因 组 近代 的 
变化 (如 基因 组 片断 的 扩 增 、 缺 失 等 )， 这 可 能 与 某 些 同一 属 ， 甚 至 同 种 中 的 基因 组 大 小 、 
结构 变化 较 大 有 关 。 

线粒体 基因 组 具有 两 种 进化 途径 是 有 其 原因 的 。 首 先是 进化 的 可 能 性 允许 向 小 基因 组 
与 大 基因 组 两 种 方向 发 展 。 至 于 为 什么 在 动物 中 的 是 小 基因 组 途径 ， 而 在 植物 中 的 是 大 基 
因 组 途径 ， 则 可 能 与 线粒体 的 功能 以 及 它们 在 动物 和 植物 中 分 别 受 到 不 同 的 选择 压力 有 
关 。 线 粒 体 是 真 核 生 物 有 氧 呼 吸 所 需 的 重要 细胞 器 官 ， 因 此 生物 的 能 量 代 谢 率 的 大 小 就 会 
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对 线粒体 及 其 基因 组 产生 一 种 效率 方面 的 压力 。 动 物 的 能 量 代谢 率 ( 以 O, 消耗 量 为 指标 ) 
在 绝 大 多 数 情 况 下 (特别 是 运动 时 ) 都 要 比 植物 的 高 得 多 ( 表 4)。 在 每 个 细胞 内 线粒体 的 数 
量 并 无 明显 的 种 类 特异 性 ， 且 变化 较 大 的 情况 下 ， 这 种 能 量 代 谢 率 的 差异 就 造成 了 动物 线 
粒 体 及 其 基因 组 受到 的 效率 方面 的 选择 压力 远大 于 植物 线粒体 及 其 基因 组 所 受到 的 ， 从 而 
导致 线粒体 在 动 植物 之 间 多 方面 的 不 同 。 在 基因 组 结构 方面 ， 动 物 由 于 高 效率 的 需要 ， 在 
进化 过 程 中 就 逐渐 “丢掉 ”一 些 非 必需 成 分 (如 重复 序列 和 内 含 子 )， 向 小 基因 组 方向 发 展 ， 
植物 由 于 所 受 效率 方面 的 选择 压力 较 小 ， 基 因 组 中 的 一 些 非 必需 (但 有 用 ) 成 分 就 可 以 继续 
保留 并 发 展 ， 即 沿 大 基因 组 途径 进化 。 作 为 高 等 植物 祖先 的 绿营 ， 在 一 些 现代 种 类 中 也 有 
较 大 的 线粒体 基因 组 (如 Chlorella pyrenoidosa， 表 3)。 另 外 ，Cyanophora paradoxa 这 种 
藻类 的 线粒体 基因 组 大 小 和 高 等 植物 的 差不多 。Cyanophora paradoxa 的 系统 分 类 位 置 还 
不 其 肯定 (Paimer，1985)， 不 过 它 可 能 与 被 认为 是 叶绿体 祖先 的 古代 蓝 细 蓝 
(cyanobacterial 特殊 的 关系 其 叶绿体 与 蓝 细 菌 的 形态 相似 ， 被 称 为 蓝 小 体 
(cyanelle)(Palmer。1985)。 因 此 ， 这 些 藻类 的 线粒体 基因 组 的 进化 途径 也 同样 有 可 能 与 植 
物 的 相似 。 


表 4 一 些 生 物 ( 组 织 ) 的 呼吸 强度 * 


Tab. 4 Rate of respiration of various organisms (tissues) 


生物 {组 织 } ul O, / (g Eh) ul O, /(g FH +h) 
休息 200 
剧烈 运动 4000 
小 鼠 
KE 2500 
奔走 20000 
ija 
休息 600 
飞行 100000 
ARCO) 13000 
Ac ket UA) 20000 
Av ECHR} 1500 
IÆ} 130 
KER) 1100 
H(t) 200 
OF SA) 112 
向 日 更 (植株 ) 1300 
天 南星 ( 肉 穗花 序 ) 450007 


TVR BLE GLE BAR, 1983; Gordon ¥, 1977, 
PRAAEFARBRR, BARA 15600—31800, 


线粒体 基因 组 这 种 向 大 、 小 两 个 方向 发 展 的 原因 及 方式 与 核 (类 核 ) 基 因 组 的 也 有 一 定 
的 相似 性 。 因 此 ， 从 原始 的 基因 组 分 别 向 小 基因 组 与 大 基因 组 进化 是 核 (类 核 ) 基 因 组 和 线 
粒 体 基因 组 共同 的 进化 模式 。 另 一 方面 ， 由 于 线粒体 基因 组 处 于 内 共生 状态 ， 是 一 种 不 完 
全 基因 组 ,* 大 ”与 “小 ”是 本 身 比较 而 言 ， 与 核 (类 核 ) 基 因 组 的 “大 ”与 * 小 ”的 含义 不 同 。 而 
且 ， 线 粒 体 基因 组 在 进化 过 程 中 面临 的 生存 与 选择 压力 较 自 主 的 核 (类 核 ) 基 因 组 小 ， 从 而 
更 有 可 能 在 小 基因 组 进化 途径 的 种 类 中 找到 原始 祖先 的 遗迹 (如 在 具 小 基因 组 的 原生 动 
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物 、 真 菌 中 的 重复 序列 、 内 含 子 等 )。 
5 讨论 与 展望 
通过 对 不 同类 型 真 核 生物 的 线粒体 基因 组 结构 的 分 析 ， 得 出 其 进化 模式 与 核 ( 类 核 ) 基 
因 组 相似 的 结论 。 并 可 以 看 出 ， 从 原始 的 基因 组 向 大 、 小 基因 组 方向 进化 这 一 模式 具有 一 
定 的 普遍 性 ， 它 不 但 对 核 (类 核 ) 基 因 组 的 起 源 和 进化 能 予以 较 好 的 说 明 ， 而 且 也 能 解释 现 
代 各 类 线粒体 基因 组 的 结构 差异 及 其 起 源 和 进化 。 实 际 上 、 这 一 模式 同样 也 能 说 明 植 物 中 
特有 的 叶绿体 基因 组 的 结构 特点 及 其 进化 ( 张 尚 宏 ， 另 文 发 表 )。 因 此 ， 重 复 序 列 、 断 裂 基 
因 ( 内 含 子 )、 核 (类 核 ) 基 因 组 、 细 胞 器 基因 组 的 起 源 和 进化 问题 都 可 以 通过 一 个 总 的 进化 
模式 予以 说 明 ( 图 2)。 生 物 基因 组 在 进化 过 程 中 ， 处 于 一 种 动态 、 更 新 、 发 展 的 变化 状 
况 ， 小 基因 组 型 的 往往 都 把 原始 的 成 分 * 于 和 失 ” 了 ; 相反 ， 大 基因 组 型 由 于 在 空间 上 


序列 相同 .可 自我 复制 的 原始 生物 大 分 子 ( 生 命 起 源 ) 
| 化 学 连结 


重复 序列 组 成 的 最 原始 的 “基因 ”和 “基因 组 ” 


| 分 化 、 特 化 


原始 的 外 显 子 .内 含 子 及 重复 序列 组 成 的 原始 基因 组 





核 { 类 核 ) 基因 组 
W H 
Ñ 
id 4 
< K 
真 核 生物 基因 组 原核 生物 基因 组 后 生动 物 高 等 植物 
线粒体 基因 组 等 线粒体 基因 组 等 


图 2 重复 序列 、 基 因 结 构 (断裂 基因 )、 核 (类 核 ) 基 因 组 和 细胞 器 基因 组 的 起 源 和 进化 
Fig. 2 The origin and evolution of repeated sequences, gene structure (split gene), nu- 


clear (nucleoid) genomes and organelle genomes 
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所 受 的 限制 或 选择 庄 力 较 小 ， 原 始 的 成 分 往往 能 在 一 定 程度 上 保留 下 来 。 因 此 ， 一般 涪 
来 ， 对 于 同一 种 基因 组 [ 即 辣 是 细胞 器 基因 组 或 核 (类 核 ) 基 因 组 ]， 车 是 越 大 ， 就 越 有 可 能 
保存 更 多 原始 (或 诅 先 ) 基 因 组 的 遗迹 。 认 识 到 这 一 点 ， 对 于 研究 基因 组 的 起 产 和 进化 是 很 
有 意义 的 。 

关于 线粒体 和 了 叶绿体 基因 组 内 存在 内 含 子 和 重复 序列 的 问题 ， 曾 是 内 共生 起 源 学 说 面 
临 的 一 个 难题 (Rochaix 等 ，1978; 李靖 炎 ，1989)j。 对 此 ， 一 方面 可 以 从 线粒体 和 叶绿体 
与 核 之 间 存 在 着 遗传 信息 的 转移 来 解释 (李靖 炎 ，1989) 另 一 方面 ， 本 文 提出 的 模式 也 能 
很 好 地 说 明 线 粒 体 和 时 绿 体 基因 组 存在 内 含 子 和 重复 序列 的 问题 ， 它 们 的 存在 不 但 与 内 共 
生起 源 不 了 矛盾， 而 且 还 是 一 个 支持 。 随 着 分 子 遗 传 学 、 细 胞 生物 掌 、 进 化 生物 学 等 学 科 . 
特别 是 进化 细胞 生物 学 和 进化 分 子 生物 学 {李靖 炎 等 ，1993) 研 究 的 深入 ， 这 一 模式 必 将 进 
一 步 完善 和 发 展 。 

目前 对 线粒体 基因 组 的 研究 在 将 椎 动物 和 真菌 两 类 生物 中 进行 得 最 多 ， 而 对 原生 动 
物 、 涪 类 等 低 等 真 核 生物 、 以 及 对 植物 的 线粒体 基因 组 的 研究 是 不 能 的 。 对 这 些 生物 的 线 
粒 体 基因 组 ， 特 别 是 对 各 类 生物 中 特大 或 特 小 的 基因 组 进行 详细 的 分 析 ， 必 将 能 提供 更 多 
有 价值 的 关于 基因 组 起 源 和 进化 的 信息 ， 因 此 都 是 很 有 意义 的 研究 。 


致谢 ”本文 承蒙 李靖 炎 教 授 提 出 宝贵 意见 ， 特 此 致谢 。 
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THE STRUCTURAL DIFFERENCES BETWEEN 
ANIMAL AND PLANT MITOCHONDRIAL GENOMES 
——TWO EVOLUTIONARY SCENARIOS 


Zhang Shanghong 


(Brotechnolagy Research Center, Zhongshan University, Guangzhou 510275) 
Abstract 


The function of mitochondria is very conserved in almost all eukaryotes, while the sizes 
and structures of mitochondrial genomes are very diverse among animals, plants, 
protozoa, algae and fungi. The causes for these differences and the corresponding evolution- 
ary paths are yet to be found. 

Animal mitochondrial genomes are very small and compact, with a size of about 16 
kb. As “an extreme example of penetic economy”, introns and non-coding repeated se- 
quences are absent, and the arrangement of genes is relatively stable. On the other hand, 
higher plant mitochondrial genomes are very large, ranging from 186 kb to 2400 kb. Their 
genomes are complex and heterogeneous, with many repeated sequences and introns 
present. On the whole. animal and plant mitochondrial genomes represent the two extremes 
of this organelle genome in eukaryotes. As for the mitochondrial genomes of protozoa, 
algae and fungi, their sizes and structures are somewhere in between these two extremes. Al- 
though heterogeneous within group, repeated sequences may be found in mitochondrial 
genomes of protozoa and fungi, The existence of introns are common in fungal 
mitochondrial genomes, even in the smallest ones, several introns are present. Among these 
three kinds of lower eukaryotes. when the mitochondrial genome is relatively small, its struc- 
ture is rather like that of animals than plants. Conversely, if the genome is relatively large, 
it resembles plant's rather than animal's. 

With the analysis of the structural character of mitochondrial genomes in different 
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eukaryotes, it seems that there are also two evolutionary scenarios for mitochondrial 
genomes similar to those for nuclear (nucleoid) genomes proposed by the author. 

As a proposed pattern for the origin and evolution of repeated sequences. gene and 
genome structure (Zhang, 1990), repeated sequences may have an ancient origin, dating 
back to the early stages of biological evolution. The most primitive “genes” and “genomes” 

would be composed of repeated sequences. With this basis. evolution would lead to a kind 
of genome consisting of early split genes and repeated sequences. Two possibilities for the fur- 
ther evolution of this kind of genome would lead to either small genome organisms or large 
genome organisms with different genomic character. If an organism evolved to have a small ` 
genome, it musi first contain the genes with higher functions for its efficient survival, leav- 
ing little or no room for repeated sequences and introns (they were lost in the course of evolu- 
tion), On the contrary, if an organism evolved to have a large genome, it may contain both 
the necessary genes and repeated sequences and introns. The repeated sequences and introns 
would be then“relics”of the primitive genomes, they would continue to play structural and 
evolutionary roles in modern genomes containing them. Modern prokaryotes would be the 
representatives of “small genome”evolutionary scenario, while the “large genome” scenario 
would be represented by modern eukaryotes. 

With the proposed pattern and the theory of endosymbiotic origin of mitochondria, it 
can be assumed that the ancestor of mitochondria possessed already a genome of considera- 
ble size, with repeated sequences and introns present. This kind of primitive mitochondrial 
genome evolved either to “small genome” mitochondria, introns and repeated sequences be- 
ing lost, as in the case of animals as well as other eukaryotes with small mitochondrial 
genomes; or to “large genome” mitochondria as those of plants and other eukaryotes with 
large mitochondrial genomes. These two evolutionary scenarios can explain well the structur- 
al character of mitochondrial genomes in different kinds of eukaryotes. The repeated se- 
quences in plant, protozoan and fungal mitochondrial genomes. and the introns in plant 
and fungal mitochondrial genomes, can be considered as “relics” of the ancestor of 
mitochondria. Their existence would not be a conflict with, but rather a support to the 
endosymbiont theory. 

In this context, a general pattern for the origin and evolution of nuclear (nucleoid) 
genomes and mitochondria] genomes (organelle genomes) can be summarized as follows (s, 
s as “small genome” scenario with repeated sequences and introns lost; 1, I’ as“ large 


genome” scenario): 
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